图像组成有助于研究图像结构,并有助于发现跨艺术形式和样式描绘的基础场景的语义。近年来,随着艺术品的数字化,可能会将成千上万个特定场景或叙述的图像联系在一起。但是,将这些数据与一致的客观性联系起来可能是一项高度挑战和耗时的任务。在这项工作中,我们提出了一种称为图像组成画布(ICC ++)的新方法,以比较和检索具有相似组成元素的图像。 ICC ++是对ICC的改进,专门针对由Max Imdahl的工作激发的低水平和高级功能(组成元素)。为此,我们与传统和最先进的方法(SOTA)方法进行了严格的定量和定性比较,表明我们所提出的方法优于所有这些方法。结合深度功能,我们的方法优于最佳的基于深度学习的方法,为数字人文学科的可解释机器学习打开了研究方向。我们将发布代码和数据后的数据。
translated by 谷歌翻译
无监督的域适应性(UDA)旨在将所学的知识从标记的源域转移到未标记的目标域。在UDA的背景下,对比度学习(CL)可以帮助更好地在特征空间中分开类。然而,在图像分割中,由于像素对比度损失的计算,较大的记忆足迹使其使用过度。此外,在医学成像中不容易获得标记的目标数据,并且获得新样品并不经济。结果,在这项工作中,当只有几个(几个)或单个(OneShot)图像可从目标域中获得时,我们将解决更具挑战性的UDA任务。我们应用样式转移模块来减轻目标样本的稀缺性。然后,为了使源和目标特征保持一致并解决传统对比损失的记忆问题,我们提出了基于质心的对比度学习(CCL)和质心规范规则器(CNR),以在方向和幅度上优化对比度对。此外,我们提出了多区域质心学习(MPCCL),以进一步降低目标特征的差异。对MS-CMRSEG数据集的几乎没有Shot评估表明,与基线相比,Cunduda在目标域上的分割性能提高了0.34的骰子分数,并且在更严格的Oneshot设置中提高了0.31骰子分数。
translated by 谷歌翻译
Spectral risk objectives - also called $L$-risks - allow for learning systems to interpolate between optimizing average-case performance (as in empirical risk minimization) and worst-case performance on a task. We develop stochastic algorithms to optimize these quantities by characterizing their subdifferential and addressing challenges such as biasedness of subgradient estimates and non-smoothness of the objective. We show theoretically and experimentally that out-of-the-box approaches such as stochastic subgradient and dual averaging are hindered by bias and that our approach outperforms them.
translated by 谷歌翻译
最近的立法导致对机器学习的兴趣,即从预测模型中删除特定的培训样本,就好像它们在培训数据集中从未存在。由于损坏/对抗性数据或仅仅是用户的更新隐私要求,也可能需要进行学习。对于不需要培训的模型(K-NN),只需删除最近的原始样品即可有效。但是,这个想法不适合学习更丰富的表示的模型。由于模型维度D的趋势,最新的想法利用了基于优化的更新,因为损失函数的Hessian颠倒了。我们使用新的条件独立系数L-CODEC的变体来识别模型参数的子集,其语义重叠在单个样本级别上。我们的方法完全避免了将(可能)巨大矩阵倒置的必要性。通过利用马尔可夫毯子的选择,我们前提是l-codec也适合深度学习以及视觉中的其他应用。与替代方案相比,L-Codec在原本是不可行的设置中可以实现近似学习,包括用于面部识别的视觉模型,人重新识别和可能需要未经学习的样品进行排除的NLP模型。代码可以在https://github.com/vsingh-group/lcodec-deep-unlearning/
translated by 谷歌翻译
预测地标的面部图像中的属性本身就是一个具有挑战性的任务,当由于使用面具而被遮挡时,进一步复杂。利用身份验证或安全登录到个人电子小工具的智能访问控制门可以使用面部作为生物特征。特别是,Covid-19大流行越来越多地验证卫生和非接触式身份验证的基础。在这种情况下,掩模的使用变得更加不可避免并且表演属性预测有助于在协作环境中对社区传播或确保他们的社会疏散来分离目标脆弱的群体。我们通过有效地覆盖不同形状,尺寸和纹理的掩模来创建一个蒙面的面部数据集,以有效地模拟戴掩模产生的变异性。本文提出了深度多任务学习(MTL)方法,共同估计来自单个掩蔽的面部图像的各种异构属性。基准面部属性UTKface数据集的实验结果表明,所提出的方法在绩效中取代其他竞争技术。
translated by 谷歌翻译
机器人感知中的一个基本问题与循环闭合检测,放置识别,对象跟踪和地图融合等应用程序匹配相同的对象或数据。虽然当匹配应该在跨多个多模式数据集合时,问题变得更具挑战性,但在此设置中可以大大提高噪声和异常值在存在的匹配中的鲁棒性和准确性。目前,多式联运技术不利用多道信息,多道技术不包含不同的方式,导致较差的结果。相比之下,我们提出了一个原则的混合整数二次框架来解决这个问题。我们在投影梯度下降算法中使用新的连续放松,以有效地获得整数程序的可行解决方案。我们通过实验证明,从我们的方法获得的对应关系比最先进的技术更稳定。与最佳替代方案相比,我们的算法在Robotics DataSet上进行了测试,导致F1分数增加了35%。
translated by 谷歌翻译
单个设备负载和能量消耗反馈是追求用户节省住宅能源的重要方法之一。这可以帮助在未使用时通过设备识别错误的设备并通过设备浪费能量。主要挑战是身份和估计每个设备上没有侵入式传感器的单个设备的能耗。非侵入性负荷监测(尼芯)或能量分解,是一种盲源分离问题,需要一个系统来估计来自聚合的家庭能量消耗的单个设备的电力使用。在本文中,我们提出了一种基于深度神经网络的基于深度神经网络的方法,用于在居住户口获得的低频电力数据上进行负载分解。我们将一系列一维卷积神经网络和长短期存储器(1D CNN-LSTM)组合以提取可以识别主动设备的特征,并给出聚合的家庭功率值的功耗。我们使用CNN在给定的时间帧中从主读取中提取特征,然后使用这些功能来分类给定设备在该时间段内是否有效。在此之后,提取的功能用于使用LSTM来模拟生成问题。我们训练LSTM以产生特定设备的分列的能耗。我们的神经网络能够产生需求方的详细反馈,为最终用户提供了重要的洞察力。该算法设计用于低功耗离线设备,如ESP32。实证计算表明,我们的模型优于参考能量分类数据集(REDD)的最先进。
translated by 谷歌翻译
什么是学习? 20美元^ {st} Centure的学习理论形式化 - 这是人工智能中沉淀的革命 - 主要是在$ \ mathit {in-diversion} $学习,即在假设训练数据被取样的假设下学习与评估分布相同的分配。这种假设使这些理论不足以表征21美元^ $ {st} MENTURE的现实世界数据问题,其通常是通过与培训数据分布(称为公共学习)不同的评估分布来表征。因此,我们通过放松这种假设来对现有可读性的正式定义进行小小的变化。然后,我们介绍$ \ MATHBF {学习\效率} $(LE)来量化学习者能够利用给定问题的数据的金额,无论它是一个或分发的问题如何。然后,我们定义并证明了可读性的广义概念之间的关系,并展示了该框架是如何足够一般的,以表征传输,多任务,元,持续和终身学习。我们希望本统一有助于弥合现实世界问题的实证实践与理论指导之间的差距。最后,因为生物学学习继续胜过机器学习算法的某些挑战,我们讨论了这一框架VI的局限性 - \'A-is-is-is-is-is-is-is-vis,它的形式化生物学学习能力,旨在为未来研究的多个途径。
translated by 谷歌翻译
社交媒体广泛用于当今世界。它有助于快速简便地分享信息,使其成为广告产品的良好媒介。由于其巨大的普及,社交媒体网络的影响因素提供了巨大的潜在客户群。但是,决定应该选择哪些影响因素,以便为能够产生低投资的高回报而选择哪些影响因素并不简单。在这项工作中,我们提出了一个基于代理的模型(ABM),可以模拟影响者在各种情景中广告活动的动态,并可以帮助发现最佳的影响者营销策略。我们的系统是一种基于概率的图形的模型,提供了额外的优势,可以将现实世界因素(如顾客对产品,客户行为,愿意支付,品牌的投资盖,影响因素扩散)的兴趣提供额外的优势。产品的性质被广告viz。奢侈品和非奢侈品。利用客户收购成本和转换率作为一个单位经济,我们通过改变产品的性质和客户兴趣来评估不同类型的影响因素的性能。我们的结果举例说明了影响者营销的环境依赖性,并提供了在各种情况下更好地策略的洞察力。例如,我们表明,随着产品的性质因奢侈品而异,名人的表现下降而纳米影响者的性能提高。在客户的兴趣方面,我们发现纳米影响者的表现随着客户利益的减少而下降,而名人的表现则改善。
translated by 谷歌翻译
决策森林(森林),尤其是随机森林和梯度促进树木,与许多监督学习场景中的其他方法相比,已经证明了最先进的准确性。尤其是,森林在表格数据中占主导地位,即当特征空间非结构化时,因此信号是特征指数置换的不变性。然而,在存在于多种多样(例如图像,文本和语音)深网(网络)(特别是卷积深网(Convnets))上的结构化数据中,倾向于优于森林。我们猜想至少部分原因是网络的输入不仅仅是特征幅度,也是其索引。相反,天真的森林实施未能明确考虑特征指数。最近提出的森林方法表明,对于每个节点,森林从某些特定分布中隐式采样一个随机矩阵。这些森林像某些类别的网络一样,通过将特征空间划分为对应于线性函数的凸多物体来学习。我们以这种方法为基础,并表明人们可以以多种感知方式选择分布来纳入特征区域。我们在数据上活在三个不同的流形上的数据上证明了经验性能:圆环,图像和时间序列。此外,我们证明了其在多元模拟环境中的强度,并且在预测癫痫患者的手术结果方面也表现出了优越性,并从非运动脑区域的原始立体定向EEG数据中预测运动方向。在所有模拟和真实数据中,歧管随机森林(MORF)算法的表现优于忽略特征空间结构并挑战Convnets的性能。此外,MORF运行迅速,并保持解释性和理论上的理由。
translated by 谷歌翻译